Guía de Recompensa con Muestras Anticipadas para Escalado de Modelos de Difusión Aprende cómo LiDAR acelera 9.5x la guía de recompensa en modelos de difusión, mejorando la alineación con intenciones humanas. 2026-06-02 · 2 min